JSoup এর মাধ্যমে HTML ফাইল লোড করা

Java Technologies - জেসুপ (JSoup) - HTML ডকুমেন্ট পার্সিং
232

জেসুপ (JSoup) ব্যবহার করে HTML ফাইল লোড করা খুবই সহজ। আপনি একটি লোকাল HTML ফাইল অথবা URL থেকে HTML ডকুমেন্ট লোড করতে পারেন। এতে ডকুমেন্টের সমস্ত HTML উপাদানগুলির সাথে কাজ করা সম্ভব হয়, যেমন ট্যাগ, অ্যাট্রিবিউটস এবং টেক্সট।


HTML ফাইল লোড করার পদ্ধতি

লোকাল HTML ফাইল লোড করা

যদি আপনার একটি লোকাল HTML ফাইল থাকে এবং সেটি জেসুপ দিয়ে লোড করতে চান, তাহলে Jsoup.parse(File in, String charsetName) মেথড ব্যবহার করতে হবে। এটি ফাইল থেকে HTML ডকুমেন্ট পার্স (parse) করে। এখানে File ক্লাস এবং charsetName আপনি যেভাবে ফাইলটি এনকোড করেছেন সেটি উল্লেখ করতে হবে।

নিচে একটি উদাহরণ দেখানো হল যেখানে একটি লোকাল HTML ফাইল লোড করা হচ্ছে:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.File;

public class JsoupLocalFileExample {
    public static void main(String[] args) throws Exception {
        // লোকাল HTML ফাইল
        File input = new File("example.html");
        
        // ফাইল লোড এবং পার্স করা
        Document doc = Jsoup.parse(input, "UTF-8");
        
        // HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
        System.out.println("Title: " + doc.title());
    }
}

এখানে example.html ফাইলটি লোকাল ডিরেক্টরিতে রাখা হয়েছে এবং সেটি লোড করা হচ্ছে। UTF-8 এনকোডিং ব্যবহৃত হয়েছে, তবে আপনি আপনার ফাইলের এনকোডিং অনুসারে এটি পরিবর্তন করতে পারেন।

URL থেকে HTML লোড করা

জেসুপ ব্যবহার করে যদি আপনি একটি URL থেকে HTML লোড করতে চান, তাহলে Jsoup.connect(String url).get() মেথড ব্যবহার করা যেতে পারে। এটি URL থেকে HTML ডকুমেন্ট লোড করে এবং পার্স করে।

নিচে একটি উদাহরণ দেওয়া হল যেখানে একটি URL থেকে HTML ডকুমেন্ট লোড করা হচ্ছে:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class JsoupUrlExample {
    public static void main(String[] args) throws Exception {
        // URL থেকে HTML লোড করা
        Document doc = Jsoup.connect("https://www.example.com").get();
        
        // HTML ডকুমেন্টের শিরোনাম প্রিন্ট করা
        System.out.println("Title: " + doc.title());
    }
}

এই কোডে Jsoup.connect() মেথডটি URL থেকে HTML ডকুমেন্ট সংগ্রহ করে, এবং get() মেথডের মাধ্যমে ডকুমেন্ট পার্স (parse) করা হয়।


সারাংশ

জেসুপ (JSoup) ব্যবহার করে HTML ফাইল লোড করা খুবই সহজ। আপনি যদি লোকাল HTML ফাইল লোড করতে চান, তাহলে Jsoup.parse() মেথড ব্যবহার করতে হবে, আর যদি URL থেকে HTML লোড করতে চান, তাহলে Jsoup.connect() মেথড ব্যবহার করতে হবে। এইভাবে আপনি HTML ডকুমেন্টের সমস্ত উপাদান নিয়ে কাজ করতে পারবেন এবং ডাটা এক্সট্র্যাক্ট করতে পারবেন।

Content added By
Promotion
NEW SATT AI এখন আপনাকে সাহায্য করতে পারে।

Are you sure to start over?

Loading...